3章 知覚
https://gyazo.com/82db38b31bfa5440a46dea1862701d4e
心理学では視覚の研究が進んでいる
映像で例を提示しやすい
3-1. 知覚の適応的な役割
知覚 = 情報の入力
情報=環境についての情報(生存に不可欠)
入力情報 = 適応に必要な情報のみ
視覚 ≠ 外界をありのままに見る
3-1-1. 見えるものと見えないもの
可視光以外の電磁波を検知する必要性は高くなかった
蜜のある部分は紫外線を反射しない
人間の視覚は人類の祖先が生きていくために必要だった情報はかなり正確に検知することができる
立体的な世界を見ている
距離の推定も正確
3-1-2. 「見る」ということ
「見る」=写しとった顔図を分析し、物体やその配置を特定したり、物体の性質や動きを検知したりする
3-2. 物体の知覚
環境をできるだけ正確に知覚する必要がある
3次元の空間
様々な物体が存在
実際に捉える光のパターン
3次元ではない
物体に分離してもいない
複雑な情報処理が必要
リアルタイムの情報
網膜像
生理的な情報
保存されている情報
生得的な知識
後天的な知識
物体の知覚
要素の抽出
要素の統合
3-2-1. 画像の分析
見るための情報処理
網膜に写った画像から物体に当たる部分を切り出す=画像を分割しなければならない
いきなり分割するのは難しい
実際の視覚システム=画像を非常に細かく分割
色々な種類の情報に符号化する
e.g. 明暗が接している時
輝度(luminance)の違いを利用して、境界を線という要素として符号化 線の傾きや動きも符号化される
神経信号に符号化される情報の種類は明暗、線、傾き、運動のほかにも色、両目視差、運動視差など
両目視差(binocular): 右目と左目の画像の間のずれ。距離を知る手がかりになる 運動視差(motion parallax): 遠くにある物体の象は網膜上で小さく動き、近くにある物体の像は大きく動く。距離を知る手がかり。 色々な種類の情報はそれぞれ専用の神経機構(モジュール module)によって処理されることがわかっている 3-2-2. ゲシュタルト要因
次は細分化した画像情報をまとめあげるという手続きが必要
同じ物体に属する情報はまとめるが、別の物体に属する情報はまとめないようにしなければならない
環境の中に存在する規則性を利用する
色々な規則性を組み合わせて最適なまとめ方を推定する必要がある
近接の要因(factor of proximity) 近くにあるものがまとまって見えるようにする
同じ物体に属する要素は近いところに位置する傾向があるという外界の規則性
ほとんどの場合、物体は閉じた輪郭を持っているという規則性
多くの物体が滑らかに連続した輪郭線を持っているという事実に対応
生得的な知識はゲシュタルト要因以外にも
物体は連続した滑らかな連続線を持っている→物理的に存在しない輪郭線を知覚
3-2-3. 物体の性質
点の運動:平面上の運動→立体の回転を平面に投影
3次元→2次元:容易
2次元→3次元:情報が不足
数学的には2次元の運動だけからでは3次元の運動を復元することはできない
自然環境の中にある多くの物体は剛体という規則性
生物の場合は部分は剛体だが全体としては剛体ではない
曲がり方には規則性があるので検知することができる
人間の姿だけでなく樹木の形と動きも光点の動きだけから検知できる
遮蔽面があると正方形が運動しているように見える。
3-2-4. 見えない情報の補填
視覚システムは目には見えないものまで知覚している
不完全な「B」や「R」の文字が知覚できる
遮蔽されている輪郭を視覚システムが補う
アモーダル補完 : モーダルに否定のア。視覚や聴覚などの感覚の種類をモードという。モーダル:目に見える、耳に聞こえる。 3-3. 知識の利用
3-3-1. 断片化された画像
このような知覚の情報処理プロセス
生得的なもの
進化の過程で遺伝子の中に組み込まれたのではないか
生得的な情報処理プログラムだけでは物体が上手く切り出せないような場合には視覚システムは後天的に獲得した知識を利用
「犬が見えるはずだ」概念的な知識を使って犬の形にまとめあげ、存在しない輪郭線まで補って犬を見ることができる
犬という言葉も概念も後天的
3-3-2. トップダウン処理とボトムアップ処理
概念的な知識を使って行う情報処理
知識・期待 →知覚像
高次認知を初期認知の方で利用する
入力情報を使って行う情報処理
網膜像→知覚像
認知の過程ではトップダウンとボトムアップが協調して働いている
一般にはトップダウン処理の役割はそれほど大きくない
ボトムアップ処理が中心
しかし、知覚から記憶、思考へと情報処理が進んでいくにつれてトップ段処理の役割は次第に増える
3-4. 3次元世界の知覚
3-4-1. 立体視
網膜に投影されるのは平面画像
実際の物理的な世界とよく似た世界を知覚してる
平面から立体的な世界をできるだけ正確に知覚するために多種多様な情報処理
様々な手がかりを使って立体的な世界を復元する
非絵画的(生理的)な手がかり: 絵で表せない手がかり。調節、輻輳、両眼視差など。 3-4-2. 非絵画的な奥行き手がかり
絵で表せない手がかり。運動視差や両眼視差
網膜に投影された情報を使っているという点では絵画的な手がかりと同じ
全く別の情報源からも奥行きの手がかりが得られる
近くのものをみるためには寄り目になる
両眼をどれだけ回転したかが距離の手がかりになる
近くのものをみるためにはピントを合わせるために水晶体の厚みを変化させる。
水晶体を支える筋肉の伸縮具合が距離の手がかりになる
物体までの距離が近いほど両眼視差は大きくなる。
両眼視差の大きさから距離を推定することができる。
3-4-3. 恒常性
距離を知覚するとそれは大きさの補正に使われる
同じ物体でも目からの距離が遠くなると網膜像は小さくなる
網膜像が小さくなったからと言ってその物体が本当に縮んだわけではない
物理的な世界を正確に知覚するためには網膜像の大きさに関わらず、同じ物体は同じ大きさに見えるように補正をする必要がある
網膜像の大きさも知覚することができるので補正が行われていることには気が付きにくい
大きさの恒常性(size constancy): 距離の違いに関わりなく普通の大きさに見えるという現象 形の恒常性(form constancy): e.g. コップの丸い口は斜めにすると網膜像は楕円形になるが、円形に見える。 ほかにも 明るさの恒常性(brightness constancy) など 3-5. 運動の知覚
3-5-1. 運動の情報
全体として静止している環境の中で動く物体の動きを正確に捉えることは重要
運動の知覚ははじめの段階では物体知覚と同じく明暗などの情報に依存している
動きを検出するためには特殊な仕組みが必要
e.g. 上から下に移動した場合にだけ反応するような神経細胞
神経細胞からの情報を総合して運動を知覚することに特化したシステムがある
物体の形を知覚するためのシステムとは独立していることがわかっている
3-5-2. 物体の運動と自分の運動
物体の運動を知覚するためには、それを自分の運動と区別する必要がある
眼球運動(eye movement): 人間の目はたえず動いている 目が動くと網膜像も動く
視覚システムは目・頭・体全体の動きも計算に入れている
3-5-3. 自分の運動の知覚
自分の運動を検出することはそれ自体も非常に重要
内耳にある三半規管、筋肉や関節などにある自己受容感覚器などによっても捉えることができる
感覚器官から送られる情報と視覚情報とを総合して自分の動きを知覚
視覚的には自分の体が前のめりになった→補正しようと重心を後ろに移す
成人は尻餅はつかないが、重心が少し後ろに移るというところは変わらない
この場合は真っすぐ立っていることを知らせている視覚以外の感覚器官よりも視覚情報のほうが強力なので重心を動かしてしまう
3-6. 知覚の情報処理
3-6-1. 情報処理の複雑さ
知覚システムは単に網膜に外界の像を写しとっているだけではない
細かく分析してから、物体の形に統合し直している
物理的な世界の規則性を利用したり、後天的に学習した知識の助けを借りたりすることもある
3-6-2. 錯視
錯視(visual illusion): 外界を正確に知覚しそこなったときに起こる